¿Cuándo se desvían incorrectamente los expertos? Análisis de enrutamiento contrafactual en modelos de lenguaje de mezcla de expertos
Descubre cuándo y por qué fallan los expertos en modelos MoE mediante un análisis de enrutamiento contrafactual. Claves para optimizar tu arquitectura.